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BESCRIPTION 

La pr6sente invention est relative k ime proteine recombinante chim6rique, un 
ADN codant ladite proteine recombinante chim^rique, ainsi que I'utilisation de cette 
proteine recombinante chim6rique pour le diagnostic in vitro des maladies en relation 
avec un virus. 

Le diagnostic precoce de la presence d'un virus dans Torganisme est essentiel 
afin, d'une part, d'^viter la propagation du virus par les malades qui ne connaissent pas 
encore leur seropositivite, et d'autre part, de proposer h ces patients un traitement 
adapte pour reculer la date d'apparition des symptomes. 

Dans le cas du SIDA (syndrome d'iramunodeficience acquise), consequence de 
I'infection par les retrovirus HIV-1 (human immunodeficiency virus-l) ou HIV-2v 
(human immunodeficiency virus-2), la primo infection est suivie d'une p6riode 
asymptomatique, d*une duree variable avant que la maladie n'^volue chez la plupart des 
patients en SIDA, caract6ris6 par I'apparition d'infections k germes opportunistes, de' 
tumeurs et de manifestations neurologiques, et le diagnostic pr6coce de la presence du 
vims HTV dans I'organisme doit etre etTectu6 que le patient ait initialement 6t6 infect6> 
par HIV-1 ou par HrV-2. 

La plupart des tests de diagnostic commercialises est base sur une reaction 
antigene-anticorps dirigee contre certaines proteines virales, telles que les proteines 
transmembranaires de I'enveloppe virale. Dans le cas d'HIV-1, les proteines de 
I'enveloppe sont d6rivees du gene env, qui code une glycoproteine pr^curseur d'un 
poids mol6culaire de 160 000 daltons, denomm6e gp 160. La gp 160 est ensuite clivee 
en deux proteines virales de Tenveloppe, la gp 120 et la gp 41 . Dans le cas d'HIV-2, la 
glycoproteine pr^curseur est la gpl40, cliv^e en gp36 et gpl05/l 10. Ainsi, dans Particle 
scientifique de Vallari ei al (Journal of microbiology, pages 3657-3661, 1998), on 
retrouve la description d'un kit de diagnostic permettant de d6tecter la presence de virus 
HIV-1 groupe M, HIV-1 groupe O et HrV-2, par I'utilisation de trois proteines 
recombinantes, d6riv6cs des regions env de virus HIV-1 groupe M, HIV-1 groupe O et 
HlV-2. D'une fafon comparable, dans I'article scientifique de Shin et al (Biochemistiy 



and molecular biology international, volume 43, n°4, pages 713-721, 1997), sont decrits 
des peptides multi-antig^niques pour d6tecter des infections aux virus HIV-1 ou HIV-2. 
Toutefois, dans de tels tests de diagnostic de plusieurs souches virales, il est 

n fec essa iie lo is de P analyse-de-seFa^par— ter-teGbaique ELISA (RnTyme Linked — 

5 ImmunoSorbrait Assay), de fixer sur le support plusieurs prot6ines recombinantes ayant 
des caractCTistiques d'adsorption (ou coating) individuelles diff6rentes, induisant des 
problemes notanunent lors de l'6tape de r6v61ation. De plus, la multiplicity des 
proteines recombinantes engendre des cotAs de fabrication importants. 

Afin d'6viter ces problemes de differences de coating entre les diff6rentes 
10 pf0t6ines recombinantes, d'autres tests de diagnostic utilisent preferentiellement des 
proteines recombinantes diimeriques, porteuse de plusieurs epitopes diriges contire des 
proteines virales differraites. 

Ainsi, le brevet EP-B-0 577 894 decrit la construction d'une proteine 
recombinante chimMque utilisee pour le diagnostic du SIDA. Cette prot6ine est 
15 porteuse des Epitopes dirig6s centre les prot6ines virales deriv6es du gdne gag de HIV-2 
et contre la proteine gp\20 d'HIV-1. Toutefois, cette prot6ine recombinante ne permet 
pas la ddtection simultanee des patients infect6s par les virus HIV-1 de groupe M et O, 
ce qui peut induire des risques de faux negatifs (patient d6tect6 s6ron6gatif alors qu'il 
est porteur du virus), faux negatifs dont les consequences peuvent 6tre dramatiques. De 
20 plus, cette proteine recombinante n'est pas porteuse de l'6pitope dirige contre la gp41, 
qui est pourtant I'^pitope immunodominant majeur, ce qui augmente, la encore, le 
risque d'apparition de faux negatif. De meme, dans Particle scientifique de Han et al 
(Biochemistiy and molecular biology international, vol 46 n°3, 1998), il est d6crit une 
prot6ine recombinante pr6sentant un Epitope dirig6 contire la gp41 d'HIV-1, et un 
25 Epitope dirig6 conti-e la gp36 d'HIV-2, ces deux epitopes 6tant li6s par un peptide de 
liaison afin de permettre 1' accessibility a chacun des epitopes. Toutefois, cette proteine 
recombinante ne permet pas la detection simultan6e des patients infect6s par les virus 
HFV-l de groupe M et O, ce qui peut induire, \k encore, des risques de faux negatifs. 

30 La pr6sente invention se propose de r6soudre I'ensemble des inconvynients de 

I'etat de la technique, en proposant une prot6ine recombinante chim6rique, facile a 



purifier et k synth6tiser, pr6sentant une forte immunor6activite vis-a-vis de s6ra de 
patients susceptibles d'etre infectes par un ou plusiems virus. 

Les definitions suivantes pennettront de mieux comprendre I'invention. 
Par ADN recombinant, on entend un sequence nucleotidique construit artificiellement 
et obtenu par g6nie gen^tique. A titre indicatii^ ledit ADN recombinant peut dtre ins6r6 
dans un organisme bote d'expression, tel que notamment une bact6rie, par un vecteur 
d'expression, notamment un plasmide bact6rien ou un bacteriophage. 

fragment nucleotidique, on entend une succession d'au moins trois acides 
nucl6otidiques codant au moins un acide amin6. 

Par site de coupure , on entend un site pennettant la separation de deux fragments 
nucleotidiques par Taction d'au moins un moyen de coupure, tel que notamment une 
enzyme de restriction qui est capable, au niveau de site de coupure correspondant k une 
sequence nucleotidique sp6cifique de gen6rer pour chaque brin deux extremit^s, I'une 
ayant un groupement 3'-OH, I'autreun groupement 5'-P. 

prot^ine recombinante chim6rique. on entend une prot6ine construite 
artificiellement et obtenue par g6nie g^6tique. A titre indicatif, ladite prot6ine 
recombinante chim6rique peut 6tre produite par un organisme h6te d'e.xpression 
modifife g6n6tiquement par insertion de la s6quence nucleotidique codant ladite 
prot6ine recombinante chimerique par un vecteur d'expression. 

Par r6^on 6pitopique , on entend une region peptidique qui va interagir de fatpon 
st6r6ospecifique avec la region peptidique paratopique de I'anticorps dirige contre le 
microorganisme, tel que notanmient le virus, present dans le s6rum du patient. Les 
regions epitopiques les plus immunogeniques sont dites immunodominantes. 
Pai- region de liaison , on entend une region assurant une meilleure accessibilit6 des 
regions paratopiques des diff^rents anticorps presents dans le s6rum des patients vis k 
vis des regions Epitopiques d'intErdt corresporidantes de la protdine recombinante 
chimdrique. 

Par region de fixation, on entend une region permettant de fixer ladite proteine 

recombinante chimerique vis-fi-vis : 

o d'un support, de manidre direct et/ou indirect, et/ou 



4 



© ci*Tjne molecule de detection, 

Le support peut 6tre compose de materiaux, tels que : 

o le venre, un materiau peu on6reux, inerte et m^caniquement stable , 




ittes^eTTiierotitFatiearrr 



5 • les m6taux : colomie de m6tal chelate de chromatogiaphie d*affinit6, 

o les particules magn6tiques, telles que d6crites dans les demandes de brevet WO-A- 
97/34909, WO-A-97/45202, WO-A-98/47000 et WO-A-99/35500 depos6es par la 
demanderesse. 

Le support peut alcrs etre utilis6 comme support d'analyse, notamment lors d'un 
10 ELISA (Enzym Linked Immunosorbent Assay), pour des etapes de purification lors 
d'lme chromatographie d*affinite, pour des 6tapes de lavage lorsque ladite proteine 
recombinante chim^rique, fix6e sur une particule magn6tique est retenue par 
aimantation dans un lieu pr6determin6. 

Par molecule de detection, on entend une mol6cule associee a un marqueur pemiettant 
15 de g6n6rer directement ou indirectement un signal detectable. Ces m^queurs peuvent 
etre notanmient radioactifs, enzymatiques, fluorescents. 

La fixation de la proteine recombinante chimerique sur ledit support ou ladite molecule 
de detection peut impliquer des ligands capables de reagir avec un anti-ligand. On peut 
citer a titre d'exemples les couples ligand/anti-ligand suivants : 
20 o biotine/streptavidine, 
o haptfene/anticorps, 
o aintigene/anticorps, 
o peptide/anticorps, 
o sucre/lectine. 



Ainsi, rinvention conceme un ADN recombinant codant une proteine recombinante 
chimerique comprenant : 

o au moins deux premiers fragments nucl6otidiques codant chacun une region 
epitopique d'au moins un microorganisme, 
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o 



au moins un deuxidme fragment nucleotidique codant une r6gion de liaison, et 



• au moins un troisidme fragment nucl^otidique codant line region de fixation. 
Selon un mode prtferee de Tinvention, le deuxi^me fragment nucleotidique comprend 
au moins un site de coupure, 

Selon un mode prefere, TADN recombinant tel que decrit precedemment est caracterise 
en ce que chaque fragment nucleotidique comprend au moins un troisieme fragment 
nucleotidique codant une region de fixation. 

L'invention conceme egalement un ADN recombinant codant une prot6ine 
recombinante chim6rique comprenant : 

• au moins dexix premiers fragments nucleotidiques codant chacun une region 
epitopique d'au moins un microorganisms 

• au moins un deuxieme fragment nucleotidique codant chacun une region de 
liaison, ledit deuxieme fragment nucleotidique comprenant en outre au moins 
un site de coupure. 

Selon un mode pref6re de 1 'invention, ledit deuxieme fragment nucleotidique a pour 
sequence au moins Tune quelconque des sequences suivantes, prises seules ou en 
combinaison : SEQ ID N^ll, SEQ ID N^'IS, SEQ ID N^15, SEQ ID N°17, SEQ ID 
N°19,ouSEQ ID N^20, 

Selon un mode prefere de I'invention, ledit microorganisme est un virus, 
preferentiellement le virus HIV-1 ou le virus HIV-2. Selon un autre mode pr6fer6 de. 
rinvention, le virus HrV-1 est de groupe M ou de gioupe O. 

Selon un mode pr6f6r6 de T invention, les premiers fragments nucleotidiques codent au 
moins deux regions immunodorainantes comprises parmi tout ou partie de la 
glycoproteine gp 120 d'HIV-1, de la glycoproteine gp 41 d'HIV-1 de groupe M, de la 
glycoproteine gp 41 d'HIV-1 de groupe O ou de la glycoproteine gp 36 d'HIV-2. 
Preferentiellement, les premiers fragments nucleotidiques ont pour sequence I'une 
quelconque des sequences SEQ ID SEQ ID N^5, SEQ ID N°7 ou SEQ ID N^9. 
Selon un autre mode prefer^ de I'invention, ledit tioisi^me fi-agment nucleotidique a 
pour sequence Tune quelconque des sequences SEQ ID N°21, SEQ ID N** 23, ou SEQ 
ID 25. 

LMnvention conceme egalement une protcine recombinante chimerique codec par un 
ADN recombinant tel que decrit ci-dessus comprenant 



0 au moins deux regions epitopiques d'au moins un microorganisme, 
« au moins une region de liaison, et 
o au moins une region de fixation. 

Sgldn un m o d e pref ei e-rierii^iTryenlionT^^ 

5 moins une glycine et/ou au moins une serine. 

Preferentiellement, ladite r6gion de liaison a pour sequence I'une quelconque des 
sequences SEQ ID 12, SEQ ID N°14, SEQ ID Nn6 ou SEQ ID N°18. 
Selon un autre mode pref6re de IMnvention, ladite r6gion de fixation est un peptide situe 
a Tune quelconque des extremites N ou C terminales de ladite proteine recombinante 
10 chimerique. 

Preferentiellement, ladite region de fixation est une region riche en histidines et ses 
derives, tel qu*une region contenant une densite d'histidines, superieure ou egale a 
25%, et preferentiellement superieure ou 6gale h 33%. Encore plus preferentiellement, 
la region de fixation comporte au moins quatre histidines et preferentiellement six 
15 histidines adjacentes. 

Selon un autre mode pref6re de Tinvention, ladite r6gion de fixation est un peptide 
comprenant au moins une lysine. 

Preferentiellement, ladite region de fixation a pour sequence SEQ ID N^22, 24 ou 26. 
L'invention conceme egalement un vecteur d'expression comprenant un ADN 
20 recombinant tel que decrit ci dessus. 

L'invention conceme egalement I'utilisation d'au moins un ADN recombinant et/ou 
d'au moins une proteine recombinante chimerique tels que decrit ci dessus pour le 
diagnostic in vitro. 

25 Les exemples suivants sont donnes a titre illustratif et n'ont aucun caractdre 

limitatif. lis permettront de mieux comprendre l'invention. 



Exemple 1 : Construction d'une prot^ine chimerique recombinante permettant la 
reconnaissance d'anticorps and HIV-1 groupe O et M et HIV-2. 

La sequence nucleotidique SEQ ID N°l a ete con^ue pour coder une proteine 
recombinante selon I'invention, et clonee dans un vecteur d'expression. Elle correspond 

5 a la sequence suivante : 

SEQ ID N° 1 : ATG AGO GGA TCC AGA ATC CTA GCT GTG GAA AGA TAG 
CTA AAG GAT CAA GAG CTC CTA GGG ATT TGG GGT TGC TCT GGA 
AAA CTC ATT TGC ACC ACT GCT GTG AGC TCC GGT TCA GGC GCT ATA 
GAG AAG TAC CTA CAG GAC CAG GCG CGG CTA AAT TCA TGG GGA 

10 TGT GCG TTT AGA CAA GTC TGC TCG AGC GGT TCT GGA GGA GGA 
GAT ATG AGG GAC AAT TGG AGA AGT GAA TTA TAT AAA TAT AAA 
GTA GTA AAA ATT GAA CCA TTA GGA GTA GCA CCC ACC AAG TCT 
GGA GGC CGT CTG CTT GCT CTG GAA ACC CTG CTT CAG AAC CAA 
CAG CTG CTT TCT CTG TGG GGT TGC AAA GGT AAG CTG GTT TGC 

15 TAC ACC TCT GTT AAA GCT TCC CAC CAT CAC CAT CAC CAT TGA TCT 
AGA 

La prot6ine recombinante chim6rique codec par la sequence SEQ ID N°l, comprend 
137 acides amines, pour une masse moleculaire de 15191,5 Da. Sa sequence en acides 
amines est la suivante: 

20 SEQ ID N°2 : MRGS RILA^^ERYLK DQQLLGIWGC SGKLICTTAV SSGSG 
AIEKYLQDQA RLNSWGCAFR QVC SSGS GGGDMRDNWR SELYKYKVSaC 
lEPLGVAPTK SAG RJLLALETLLQ NQQLLSLWG CKGBXVCYTS V KAS 

HHHHHH. 

La presence de MRGS et la sequence ATG AGG GGA TCC correspondante est 
25 introduite par la technique de clonage utilisee dans le vecteur d'expression pMR. La 
s6quence d'interSt est introduite dans le vecteur pMR entre le site de restriction BamHI 
en 5' et le site Xbal en 3% ce qui conduit a la fusion de la sequence MRGS en N- 
terminal de la proteine d'int6rat. Seul le codon d'initiation ATG et par consequent 
I'acide amine Met est vraiment indispensable dans cette sequence. 
30 Lcs i-egions epitopiques sont incliqu6cs cn gras, la region de fixation en italique et les 
regions de liaisons en non gras non italique. 



Cette proteine recombinante diim6rique comprend : 

a) plusieurs regions Spitopiques (indiquees en gras dans la SEQ ID n^2) permettant : 

p -larre(^nnaissaDee-^es-^tieefps-^t^-^^^ 

5 La sequence SEQ ID N^'S est issue de la souche virale HIV-1 groupe M (clone de 

reference HXB2) et correspond a la sequence suivante : 

SEQ ID N^'S : AGA ATC CTA GCT GTG GAA AGA TAG CTA AAG GAT CAA 
CAG CTC CTA GGG ATT TGG GGT TGC TOT GGA AAA CTC ATT TGC AGO . 
ACT GCT GTG, 

10 Cette sequence est amplifie par PCR (polymerase chain reaction) par rutilisation 

d' amorces d' amplification sp6cifiques (amorce sense 5' AGT CGG ATC CAG AAT 

CCT AGC TGT GGA A 3' et amorce antisense 5' GCC TGA TCC GGA GCT CAC 

AGC AGT GGT GCA AAT 3' ; 17 cycles de PCR sont realises avec a chaque cycle 

une etape de denaturation a 94^C pendant 1 minute (min), une etape d'hybridation a 

15 52°C pendant 1 min et une 6tape d'61ongation 72^C pendant 20 secondes. 

Le fragment nucleotidique obtenu code pour le peptide correspondant h la s^uence en 

acides amines SEQ ID N°4 : RILAVERYLK DQQLLGIWGC SGKLICTTAV. 

o la reconnaissance des anticorps anti-HIV~l (groupe O ; gp41) : 

La sequence SEQ ID N° 5 correspond a une sequence ADN artificielle, con9ue a partir 

20 de la sequence en acide amine de la souche virale HIV-1 groupe O [clone ANT70], 
Cette portion synfh6tique a 6te confu en selectionnant des codons dont I'utilisation est 
favorable a T expression de gdne chez E. colL La sequence est la suivante : 
SEQ ID N° 5 : CGT CTG CTT GCT CTG GAA ACC CTG CTT CAG AAC CAA 
CAG CTG CTT TCT CTG TGG GGT TGC AAA GGT AAG CTG GTT TGC TAG 

25 ACC TCT GTT. 

Cette sequence est construite par PCR par Tutilisation de 3 oligonucleotides (un 
oligonucleotide sens 5' AAG TCT GCA GGC CGT CTG CTT GCT CTG GAA ACC CTG 
CTT CAG AAC CAA CAG CTG CTT TCT 3' et deux oligonucleotides antisens 5' GCT 
ATC TAG ATC AAT GGT GAT GGT GAT GGT GGG AAG CTT TAA CAG AGG TGT 

30 AGC AAA C 3' 

et 5' AAC AGA GGT GTA GCA AAC CAG CTT ACC TTT GCA ACC CCA CAG 
AGA AAG CAG CTG TTG GTT 3' ; 17 cycles de PCR sont r6alis6s avec k chaque 
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cycle line aape de denaturation k 9°C pendant 1 min, une etape d'hybridation k 50°C 
pendant 1 min etune etape d'elongation 68°C pendant 20 secondes). 
Ce fragment nucleotidique code pour le peptide correspondant a la sequence en acides 
amines SEQ ID N°6 : RLLALETLLQ NQQLLSLWGC KGKLVCYTSV . 

«> la reconnaissanc e des anticorps anti-HIV-2 (so36\ : 
La sequence SEQ ID N°7 est issue de la souche virale HIV-2 (clone de reference ROD) 
et correspond a la sequence suivante : 

SEQ ID N*>7 : GOT ATA GAG AAG TAG CTA GAG GAG GAG GCG CGG CTA 
AAT TCA TGG GGA TGT GCG TTT AGA CAA GTC TGC 

Cette sequence est amplifi6e par PGR par I'utilisation d'amorces d'amplification 
sp6cifiques (amorce sense 5' CTG TGA GOT GCG GTT GAG GCG CTA TAG AGA 
AGT ACC TA 3' et amorce antisense 5' AGA ACC GCT GGA GCA GAG TTG TCT 
AAA CGC 3' ; 17 cycles de PGR sont realises avec k chaque cycle une 6tape de 
denaturation k 94°C pendant 1 min, une 6tape d'hybridation a 52°C pendant 1 min et 
1 5 une 6tape d'61ongation 72°C pendant 20 secondes). 

Ce fragment nucleotidique code pour le peptide correspondant k la s6quence en acides 
amines SEQ ID N^S : AIEKYLQDQA RLNSWGCAFR QVC. 

9 la reconnaissance des anticorps anti-HIV-1 ( groune M : gpl20'> : 
La sequence SEQ ID N<'9 est issue de la souche virale HlV-1 groupe M (clone de 
20 r6f6rence HXB2) et correspond a la sequence suivante : 

SEQ ID N°9 : GGA GGA GGA GAT ATG AGG GAG AAT TGG AGA AGT GAA 
TTA TAT AAA TAT AAA GTA GTA AAA ATT GAA CCA TTA GGA GTA GCA 
CCC ACC AAG. 

Cette sequence est amplifie par PGR par I'utilisation d'amorces d'amplification 
25 sp6cifiques (amorce sense 5' GTC TGC TGG AGC GGT TCT GGA GGA GGA GAT 
ATG AGG 3' et amorce antisens 5' ACG TGC TGC AGA CTT GGT GGG TGC TAG 
TCC 3' ; 17 cycles de PGR sont realises comprenant a chaque cycle une 6tape de 
denaturation k 94°C pendant Imin, une 6tape d'hybridation k 52°C pendant 1 min et 
une 6tape d'elongation a 72«'C pendant 20 secondes). 

Ce fragment nucleotidique code pour le peptide correspondant a la S(£quence en acides 
amines SEQ ID N°10 : GGGDMRDNWR SELYKYKVVK IKPLGVAPTK 
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b) des regions de liaisons, entre chacune des regions epitopiques citees precedemment, 
permettant : 

«s — aiTTiiveau-niudrtetidique— l%itredue1ae de s 

5 enzymes de restriction pouvant etre utilis6s pour modifier, retirer ou aj outer 

un domaine 6pitopique, et 
© au niveau proteique, Tobtention de regions d'espacement, flexibles, assurant 
ime meilleure accessibilit6 des anticorps potentiels k chacun des domaines, 
Ainsi, la sequence nucleotidique SEQ ID N^l 1 : G AGC TCC GGT TCA GGC permet 

10 Tobtention d'un site de coupure par Venzyme Sac I (indique en gras), le G indique en 
italique, etant la demiere base de la sequence nucl6otidique codant le peptide 
permettant la reconnaissance des anticorps anti HIV-1, groupe M. Cette sequence code 
la region flexible correspondant au peptide de s6quence SEQ ID N''12 : SSG SG. 
La sequence nucleotidique SEQ ID N^13 : CTCG AGC GGT TCT permet Pobtention 

15 d'lm site de coupure par Tenzyme Xho I (indiqu6 en gras), le C indique en italique, 
etant la demiere base de la sequence nucleotidique codant le peptide permettant la 
reconnaissance des anticorps anti HIV-2. Cette sequence code la r6gion flexible 
correspondant au peptide de sequence SEQ ID N°14 : SSGS. 

La sequence nucleotidique SEQ ID N°15 : TCT GCA GGC permet Pobtention d'lm 
20 site de coupure par Fenzyme Pst I (indique en gras). Cette sequence code la region 
flexible correspondant au peptide de sequence SEQ ID 16 : SAG 
La sequence nucleotidique SEQ ID N^17 : AAA GCT TCC permet I'obtention d'lm 
site de coupure par Tenzyme Hind in (indique en gras). Cette sequence code la region 
flexible correspondant au peptide de sequeaice SEQ ID N*' 18 : KAS. 
25 Les sequences SEQ ID N°19 : ATG AGG GGA TCC et SEQ ID N°20 TGA TCT 
AGA permettent respectivement d'obtenir un site de coupure par Tenzyme BamHl 
(indiqu6 en gras) et un site de coupure par Tenzyme Xbal peimettant I'insertion ou 
r extraction de la totalite de la sequence codant la proteine recombinante selon 
rinvention dans un plasmide. 



c) une region de fixation et permettant la purification de la prot^ine recombinante 
chimerique : une sequence hexahistidine est ajout^e en C-tenninal afin de faciliter 
ult^rieurement I'etape de purification de la proteine recombinante chimerique. Ce 
peptide, codee par la sequence nucleotidique SEQ ID N°21 : CAC CAT CAC CAT 
CAC CAT, correspond a la sequence SEQ ID N°22 : HHHHHH. 
A titre indicatif, cette region de fixation particuli^e, comprenant une succession 
d'histidine, permet notamment la fixation orient^e de la protane recombinante sur un 
support constitu6 de silice ou d'oxydes m6talliques, tel que d6crit dans le brevet FR-B- 
98/04879. 

L'ordre des sequences codant les diff^rentes r6gions 6pitopiques immunodominantes de 
la prot6ine recombinante chim6rique pent dtre ^entuellement modifie. La longueur des 
regions de liaison peut 6galement &tre modifi6e pour ameliorer I'accessibilite d'un 
epitope. Certains Epitopes peuvent etre pr^sentes plusieurs fois au sein de la proteine 
recombinante chim6rique. Les epitopes peuvent egalement presenter des variations par 
rapport aux sequences decrites dans I'exemple ci dessus selon le sous type ou le clone 
HIV qu'ils representent. 

Exempie 2 : Expression et purification de la proteine recombinante chimerique de 
I'exemple 1 

La premiere 6tape consiste k insurer la sequence SEQ ID N°l (exempie 1), dans un 
vecteur d'expression (pMR) puis k transformer une bact^rie E. coli (souche BL21) avec 
la construction plasmidique obtenue selon un protocole ciassique de clonage connu de 
rhomme du metier. Les bacteries transfonnees sont s61ectionnees grace k leur 
resistance a I'ampicilline poitee par le vecteur pMR. 

Un clone de bact^rie recombinante est alors s61ectionn6 pour ensemencer une pr6culture 
de 40 ml de milieu 2x YT (tryptone 16 g/1 ; yeast extract 10 g/1 ; NaCl 5 g/1, pH 7,0) 
contenant 100 jig/ml ampicilUne. Aprfe XSkUU d'incubation a 37"'C sous agitation a 
250 rpra, cette precuUure est utilis^e pour ensemencer 1 litre de milieu 2xYT contenant 
2 % glucose et 100 ^ig/ml ampicilline. Cette culture est incubee k 3TC sous agitation k 
250 rpm. Lorsque la DOooo «.» a atteint 0,7-0,9, de I'TPTG (isopropyl-p-D- 
thiogalactoside, Eurogentcc) est ajout6 a 0,5 mM final dans le milieu de culture et la 



culture est poursuivie pendant 4 h. L'IPTG permet d'induire ['expression de la proteine 
diim^rique recombinante SEQ ID N°2 qui s'accumule dans les bact6ries sous forme de 
corps d'inclusion. Apres 4 h d'induction, la culture est centrifugee k 6000 rpm pendant 

— : 30-rnin-^r4S€-et4e-eulet-d©-ba©teries-est-GO^^^ 

5 Afin d'extraire la proteine recombinante des corps d'inclusion, les bactdries 
decongel6es sont lysees. Pour cela, les culots de bacteries correspondant k une culture 
d'un litre sont repris dans 100 ml de tampon de lys& (PBS IX contenant des inhibiteurs 
de proteases : lysozyme : 1 mg/ml ; benzonase : 2,5 unit6s par ml (Novagen®) et Mg^* : 
1 mM) en vortexant jusqu'i obtenir une suspension homogdne. Cette solution est 
10 incub6e 1 heure a temperature ambiante sous agitation. La solution est ensuite 
centrifug6e 30 min a 4°C a 1 0000 g. 

Le culot obtenu contient les corps d'inclusion. Ce culot est mis en suspension dans 50 
ml de tampon de solubilisation (bicarbonate de sodium : 40 mM ; NaQ : 300 mM ; 
SDS : 1% ; p-mercaptoethanol : 20 mM, pH 9,6) contenant des inhibiteurs de proteases 
15 (complete EDTA-free, Roche®). La solution ainsi obtenue est incub6e 16 18 h sous • 
agitation entre 18 et 25°C. EUe est ensuite dilute au quart avec un tampon PBS 2X 
contenant 8 mM d'imidazole et des inhibiteurs de proteases (complete EDTA-free, 
Roche®) k pH 8,0. Une centrifugation a 10 000 g pendant 30 min k 20°C permet 
d'obtenir un sumageant lirapide, qui est filtre sur filtre 0,45 |i et purifie par 
20 chromatographic d'afFmite sur une colonne de chelation de metaux (matrice nickel- 
nitrilotriacetic add (Ni-NTA, Qiagen). Les 200 ml d'echantillon sont deposes (1 
ml/min) k 18-25«'C sur une colonne de 8 ml de gel Ni-NTA equilibrte en tampon Al 
(PBS 2X, ur6e 4 M, imidazole 6 mM, pH 7,8 contenant p-mercaptoethanol 5 mM) ou 
A2 (PBS 2X, SDS 0.25 %, imidazole 6 mM, pH 7,8 contenant p-mercaptoedianol 5 
25 mM). La colonne est ensuite lav6e en tampon Al ou A2, jusqu'a obtention en sortie de 
colonne d'une DO280nm=0. L'61ution de la prot&ne recombinante est obtenue par 
application d'un tampon Bl (PBS 2X, uree 4M, imidazole 100 mM, pH 7,5, contraiant 
p-mercaptoethanol 5 mM) ou B2 (PBS 2X, SDS 0.25%, imidazole 100 mM, pH 7,5, 
contenant p-mercaptoethanol 5 mM). 
30 Des quantity de I'ordre de 50 mg de proteine recombinante purifite peuvait 6tre 
obtenues k partir d'un litre de culture. 



La proteine recorabinante ainsi purifiee est soumise a un traitement denaturant par 
addition de SDS (1500 molecules par molecule de proteine recombinante), DTT 5 raM, 
bicarbonate de sodium 50 mM au pH 9,6 et chauffage 30 min a ST^'C. La stockiometrie 
molecules de SDS/ molecules de proteine recombinante peut dtre modifiee (idealement 
5 diminuee si la duree ou temperature de chauffage est augment6e). Pai- exemple, des 
r6sultats similaires sont obtenus par addition de 250 molecules de SDS/molecule de 
proteine recombinante, DTT 5 mM, bicarbonate de sodium 50 mM au pH 9.6 et 
chauffage 2 heures a 40^*0. 

La prot6ine ainsi denatur^e est stabilisee par addition de Polyethylene glycol (MW 3350 - 
10 en particulier) pour une stockiometrie de 10 molecules de PEG par molecule de 
proteine puis dialysee a 4''C pendant 18 a 24 heures contre un tampon bicarbonate de 
sodium 50mM, EDTA ImM, SDS 0,01%, PEG 1 mg/1, pH 9,6. 

Exemple 3 : Evaluation et validation de la proteine recombinante chimSrique dans 
1 5 un test VTOAS® (bioMerieux) 

Cette validation est realisee en test VIDAS® par Tutilisation d'une solution de proteine 
chimericpie recombinante obtenue selon les exemples 1 et 2 et ayant subit le traitement 
denaturant decrit dans Texemple 2. 

Le principe du test VIDAS® est le suivant: im c6ne constitue le support solide qui sert 
20 egalement de systdme de pipetage pour les reactifs presents dans la barrette. La proteine 
recombinante est fixee sur ie cone. Apres une etape de dilution, Techantillon est aspir6 
et retbule plusieurs fois a Pinterieur du cone. Ceci permet aux IgG anti-VIH de 
I'echantillon de se lier a la proteine recombinante. Les composants non lies sont 
elimines par lavage. Un anticorps anti-IgG humaines conjugu6 h la phosphatase alcaline 
25 (PAL) est alors incube dans le c6ne ou il se fixe aux IgG anti-VIH. Des etapes de 
lavage eliminent le conjugu6 non fixe. 

Pendant la demifere etape de revelation, le substrat de la PAL, le 4-methyl-ombeUiferyl 
phosphate, est hydrolys6 en 4-mefliyl-ombelliferonc dont la fluorescence emise a 450 
nm est mesuree. L'intensite de la fluorescence est mesur^e par le systdme optiquc du 
30 Vidas® et est proportionnellc a la presence dlgG anti-VIH presents dans Pechantillon. 



Les resultats sont analyses automatiquement par le VIDAS® et exprimes en RFV 
(Relative Fluorescent Value). 

Dans cet exemple, une solution de prot6ine recombinante obtenue selon les exemples 1 

5 pH 9,6-9,8) est incubee avec les cones VIDAS® 1 8 a 24 h a temperature ambiante (120 
|il/c6ne). Les c6nes sont ensuite incubes dans un tampon de passivation (330 |il/c6ne de 
tampon HIV Duo contenant 3 % de s6rum de veau) pendant 18 a 24 h a temperature 
ambiante 

Des solutions tests (Etablissement Fran9ais du Sang, France), de serologic HIV connue, 

10 (28 |Ltl de serum, de statut HIV connu, dilue dans 300 ^il de tampon PBS 1 X, NaCl 8,76 
g/1, tween 20 2,5 % (v/v), lait ecreme en poudre 2,5 g/1, albumine 20 g/1, et 3 % (v/v) 
s6rum de veau, pH 6,1) sont alors mis en contact avec les cones presentant les proteines 
recombinantes de Texemple 1, pendant 13 min et 20 secondes (80 cycles de 
pipettage/refoulement de 10 secondes). Une 6tape de lavage est ensuite ejEFectu6e en 

15 tampon Tris 24,23 g/1, acide maleique 23,22 g/1, tween 20 0,05% (v/v), NaOH 6 g/1, 
NaCl 8,77 g/1, pH 6,1. Une solution d'anticoips anti-Fc humain conjugue k la PAL 
(P5F2F7) et dilu6 au l/SOOO^"" est incubee au contact du c6ne pendant 5 min (avec 30 
cycles de pipettage /refoulement de 1 0 secondes chacun). Une demiere etape de lavage 
est realise en tampon HIV Duo, avant 1' etape finale de revelation. 

20 Les resultats obtenus, sont exprimes en RFV (Relative Fluorescent Value). Les valeurs 
RFV superieures ou egales a 250 sont arbitrairement consider6es comme provenant 
d'un serum HIV sero positifs. Les valeurs inferieures sont negatives. Les resultats 
obtenus avec la prot6ine recombinante obtenue selon les exemples 1 et 2, sont tous en 
accord avec la s6rologie HIV, prealablement detOTninee par le test VIDAS HIV Duo® 

25 (bioM6rieux®). 

L'utilisation d'une telle prot^ine recombinante en test VTDAS® permet bien de 
determiner la s6rologie HIV des echantillons. 



Tableau 1 - Validation exp6rimentaie de la prot6ine recombinante obtenue selon les exemples 1 et 2 
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Exemple 4 : Construction d'une proteine recombinante biotinylee 

Utie sequence consensus de biotinylation in vivo dans E,coli telle que decrite par 

Schatz, (Bio/technology, vol. 1 1 , 1993) peut etre fusionn^e a la SEQ ID if 2 



CAG AAA ATG GAA TGG CAC CCG CAC, codant le peptide de s6quence SEQ ID 
N^24 : LHHILEAQKM EWHPH, peraiet la biotinylation de la prot6ine recombinante 
obtenue selon les exemples 1 et 2 afin d'utiliser une prot6ine avidine conjuguee a une 
enzyme pour la phase de revelation dans un test EIA. 

Les conditions d'expression et purification decrites dans I'exemples 2 restent valides 
avec quelques modifications. Les bacteries transform 6es avec le plasmide recombinant 
peuvent 6tre de type BL21 ou AVBlOl (Avidity, LLC). Le milieu de culture utilise 
pour Texpression peut Stre de type : 2x YT (tryptone 1 6 g/1 ; yeast extract 1 0 g/1 ; NaCl 
5 g/1, pH 7,0) contenant 100 fxg/ml ampicilline et suppl6ment6 par 12 fig par ml de 
biotine. 

Exemple 5 : Evaluation et validation de la proteine recombinante chimerique 
biotinylee in vivo dans un test VIDAS® de type sandwich* 

Cette validation est selon un protocole VIDAS® decrit dans rexemple 3 et modifi^ 
comme suit : la proteine chimerique recombinaate obtenue selon T exemple 1 est fixee 
sur la phase solide (cone VIDAS®) comme decrit dans T exemple 3, Apres incubation 
de l'6chantillon dilue avec le cone puis lavage, les Ig G anti HIV liees aux cones sont 
incubees avec la proteine chimerique recombinante obtenue selon Texemple 4. Apr^s 
lavage, les proteines recombinantes biotynyl6es fixees sur le c6ne reagissent avec un 
solution de streptavidine conjugu6 a la PAL. L'6tape finale de r6v61ation est conforme a 
la description de 1* exemple 3. 

Les r6sultats sont pr6sentes dans le tableau 2. Les valeurs RFV sup6rieures ou egales k 
250 sont arbitrairement consid6rees comme positives. L'utilisation d*une telle proteine 
recombinante en test VIDAS® permet bien de detemiiner la s6rologie HIV des 
echantillons. 
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Tableau 2 — Validation exp6rimentale de la prot6ine recombinante obtenue selon les 
exemples 4 et 5 
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5 Exemple 6 : Amelioration de la sensibility de la proteine recombinante chimerique . 

Afin d'augmenter encore la sensibilite de reconnaissance des anticorps anti-HIV de la 
proteine recombinante obtenue selon 1' invention de nouveaux epitopes caracteristiques 
de certains sous-types HIV peuvent etre ajoutes ou un des epitopes decrit peut etre 
duplique dans la sequence de la proteine chimerique. 

10 

Exemple 7 : Addition d^une sequence hexalysine h la proteine recombinante pour 
faciliter le couplage d'une enzyme ou de biotine, notamment sur la fonction p- 
amin^ de la lysine* 

Une sequence codant pour six lysines peut Stre fusionn6e en 3' de la SEQ ID n°2. 
15 L'addition de la sequence ADN SEQ ID n^25: AAG AAA AAG AAA AAG AAA, 
codant pour le peptide de sequence SEQ ID n°26 : KKKKICIC, permet le couplage 
oriente d' enzyme ou biotine en C-tenninal de la proteine chimerique. Le couplage de 
cette proteine recombinante a la phosphatase alcaline en parti culier permet Tutilisation 
de la proteine couplee dans un format sandwich de revelation des anticoips anti-HrV. 



REVENDICATIONS 



1 . ADN recombinant codant xme prot6ine recombinante chimerique comprenant 

S au moms deux premiers nagments nucieotidiques codani chacun uae 

region epitopique d*au moins un microorganisme, 
o au moins un deuxieme fragment nucl^otidique codant une region de 

liaison, et 

o au moins un troisieme fragment nucleotidique codant une region de 
fixation. 

2. ADN recombinant, seion la revendication 1, caract6rise en ce que ledit 
deuxidme fragment nucleotidique comprend au moins un site de coupure. 



3. ADN recombinant, selon la revendication 2, caract6rise en ce que chaque 
15 fragment nucleotidique comprend au moins un troisieme fragment nucleotidique 

codant une region de fixation. 

4. ADN recombinant codant une prot6ine recombinante cliim6rique comprenant 

o au moins deux premiers fragments nucieotidiques codant chacun une region 
20 epitopique d* au moins un microorganisme, 

© au moins un deuxifeme fragment nucleotidique codant une region de liaison, 

ledit deuxidme fragment nucleotidique comprenant en outre au moins un site 

de coupure. 
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25 5. ADN recombinant selon Tune quelconque des revendi cations 1^4 caracterise 

en ce que ledit deuxieme fragment nucleotidique a pour sequence au moins 
Tune quelconque des sequences suivantes, prises seules ou en combinaison, 
SEQ ID N^ll SEQ ID N^13, SEQ ID N°15, SEQ ID N°17, SEQ ID N°19, ou 
SEQ ID N*^20. 
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6. ADN, selon Tune quelconque des revendications 14 5, caracteris6 en ce que 
ledit microorganisrae est un virus, preferentiellement le virus HIV-1 ou le virus 
HIV-2. 

7. ADN, selon la revendication 6, caracterise en ce que le virus HIV-1 est de 
groupe M ou de groupe O 

8. ADN, selon Tune quelconque des revendications 1^7 caract6rise en ce que les 
premiers fragments nucleotidiques codent au moins deux regions 
immunodominantes comprises parmi tout ou partie de la glycoproteine gp 120 
d'HIV-1, de la glycoproteine gp 41 d'HIV-1 de groupe M, de la glycoproteine 
gp 41 d'HIV-1 de groupe O ou de la glycoproteine gp 36 d'HIV-2, 

9. ADN, selon la revendication 8, caracterise en ce que chaque premier fragment 
nucleotidique a pour sequence Tune quelconque des s6quences SEQ ED N°3, 
SEQ ID N^5, SEQ ID N°7 ou SEQ ID N^9. 

10. ADN, selon Tune quelconque des revendications 1 i 9, caracterise en ce que 
ledit troisieme fragment nucl6otidique a pour sequence Tune quelconque des 
sequences SEQ ID N°2 1 , SEQ ID N° 23 ou SEQ ID N°25. 

1 1. Proteine recombinante chimerique codec par un ADN recombinant, selon I'une 
quelconque des revendications 1 a 10, comprenant 

• au moins deux regions 6pitopiques d'au moins un microorganisme, 

• au moins une region de liaison, et 
« au moins une region de fixation. 



12. Proteine, selon la revendication 11, carac(:6risee en ce que ladite r6gion de 
liaison est un peptide comprenant au moins une glycine et/ou au moins une 
serine. 



# ao • 



13. Proteine, selon la revendication 12, caracteris6e en ce que ladite region de 
liaison a pour sequence Tune quelconque des sequences SEQ ID 12, SEQ ID 
N^14, SEQ ID N^16 ou SEQ ID N^18. 



14. Prot6ine, selon la revendication 11 a 13, caracteris6e en ce que ladite region de 
fixation est un peptide situ6 4 Tune quelconque des extremit6s N ou C- 
terminales de ladite proteine recombinante chimerique, 

15. Proteine, selon la revendication 11 a 14, caracteris6e en ce que ladite region de 
fixation est une region riche en histidines et ses derives, tel qu*xme region 
contenant une densit6 d'histidines, superieure ou egale a 25%, et 
preferentiellement sup6rieure ou egale h 33%. 

" . *- • 

16. Prot6ine selon la revendication 15 caract6ris6e en ce que la region de fixation 
comporte au moins quatre histidines et preferentiellement six histidines 
adjacentes, 

17. Proteine selon la revendication 11 a 16 caracterisee en ce que ladite region de 
fixation est un peptide comprenant au moins une lysine^ 

20 

18. Proteine selon la revendication 17 caracteris6e en ce que ladite r6gion de 
fixation a pour sequence SEQ ID N^2, 24 ou 26. 

19. Vecteur d'expression comprenant un ADN recombinant selon Tune quelconque 
25 des revendications 1 a 10. 
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20. Utilisation d'au moins un ADN selon Tune quelconque des revendications 1 ou 
10 et/ou d'au moins une proteine recombinante chimerique selon Tune 
quelconque des revendications 1 1 a 18 pour le diagnostic in vitro. 



SEQUENCE LISTING 



<110> BIOMERIEDX SA 

<120> Proteine recombinante chim^rique et diagnostic in vitro 

<130> Unknown 

<160> 26 

<170> Patentin version 3.1 

<210> 1 

<211> 423 

<212> DNA 

<213> Artificial 

<400> 1 

atgaggggat ccagaatcct agctgtggaa agatacctaa aggatcaaca gctcctag 
gg 60 

atttggggtt gctctggaaa actcatttgc accactgctg tgagctccgg ttcaggcg • 
ct 12 0 

atagagaagt acctacagga ccaggcgcgg ctaaattcat ggggatgtgc gtttagac ' 
aa 180 

gtctgctcga gcggttctgg aggaggagat atgagggaca attggagaag tgaattat 
at 240 

aaatataaag tagtaaaaat tgaaccatta ggagtagcac ccaccaagtc tgcaggcc 
gt 300 

ctgcttgctc tggaaaccct gcttcagaac caacagctgc tttctctgtg gggttgca 
aa 360 

ggtaagctgg tttgctacac ctctgttaaa gcttcccacc atcaccatca ccattgat 
ct 420 

aga 

423 



<210> 2 
<211> 138 
<212> PRT 
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<213> Artificial 



<400> 2 



Met Arg Gly Ser Arg lie Leu Ala Val Glu Arg Tyr Leu Lys Asp Gin 
15 10 15 



Gin Leu Leu Gly lie Trp Gly Cys Ser Gly Lys Leu lie Cys Thr Thr 
20 25 30 



Ala Val Ser Ser Gly 
35 

Ala Arg Leu Asn Ser 
50 

Gly Ser Gly Gly Gly 
65 

Lys Tyr Lys Val Val 

85 



Ser Gly Ala He Glu Lys 
40 

Trp Gly Cys Ala Phe Arg 
55 

Asp Met Arg Asp Asn Trp 
70 75 

Lys He Glu Pro Leu Gly 

90 



Tyr Leu Gin Asp Gin 
45 

Gin Val Cys Ser Ser 
60 

Arg Ser Glu Leu Tyr 

80 

> 

Val Ala Pro Thr Lys 
95 



Ser Ala Gly Arg Leu Leu Ala Leu Glu Thr Leu Leu Gin Asn Gin Gin 
100 105 110 
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Leu Leu Ser Leu^^) Gly Cys Lys Gly Lys Leu '^^Cys Tyr Thr Ser 

115 120 125 



Val Lys Ala Ser His His His His His His 
130 135 



<210> 3 

<211> 90 

<212> DNA 

<213> HIV 1 

<400> 3 

agaatcctag ctgtggaaag atacctaaag gatcaacagc tcctagggat ttggggtt 
gc 60 

tctggaaaac tcatttgcac cactgctgtg 
90 



<210> 


.4 


<211> 


30 


<212> 


PRT 


<213> 


HIV 1 


<400> 


4 



Arg lie Leu Ala Val Glu Arg Tyr Leu Lys Asp Gin Gin Leu Leu Gly 
15 10 15 



lie Trp Gly Cys Ser Gly Lys Leu lie Cys Thr Thr Ala Val 
20 25 30 



<210> 5 

<211> 90 

<212> DNA 

<213> HIV 1 

<400> 5 
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polytop • ST25 . txt 






cgtctgcttg ctctggaaac cctgcttcag aaccaacagc tgctttctct gtggggtt 



<210> 6 

<211> 30 

<212> PRT 

<213> HIV 1 

<400> 6 

Arg Leu Leu Ala Leu Glu Thr Leu Leu Gin Asn Gin Gin Leu Leu Ser 
15 10 15 



Leu Trp Gly Cys Lys Gly Lys Leu Val Cys Tyr Thr Ser Val 



<210> 7 

<211> 69 

<212> DNA 

<213> HIV 2 

<400> 7 

gctatagaga agtacctaca ggaccaggcg cggctaaatt catggggatg tgcgttta 
ga 60 

caagtctgc 





69 


<210> 


8 


<211> 


23 


<212> 


PRT 


<213> 


HIV 2 


<400> 


8 



Ala lie Glu Lys Tyr Leu Gin Asp Gin Ala Arg Leu Asn Ser Trp Gly 



60 



aaaggtaagc tggtttgcta cacctctgtt 
90 
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Cys Ala Phe Arg Gin Val Cys 
20 

<210> 9 
<211> 90 
<212> DNA 
<213> HIV 1 

<400> 9 

ggaggaggag atatgaggga caattggaga agtgaattat ataaatataa agtagtaa 
aa 60 

attgaaccat taggagtagc acccaccaag 
90 



<210> 


10 


<211> 


30 


<212> 


PRT 


<213> 


HIV 


<400> 


10 



Gly Gly Gly Asp Met Arg Asp Asn Trp Arg Ser Glu Leu Tyr Lys Tyr 
15 10 15 



Lys Val Val Lys lie Glu Pro Leu Gly Val Ala Pro Thr Lys 
20 25 30 



<210> 11 

<211> 16 

<212> DNA 

<213> Artificial 

<400> 11 
gagctccggt tcaggc 
16 
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polytop . ST25 . txt 



<210> 


12 


<211> 


5 


<212> 


PRT 


<213> 


Artificial 


<400> 


12 


Ser Ser Gly Ser Gly 


1 


5 


<210> 


13 


<211> 


13 


<212> 


DNA 


<213> 


Artificial 


<400> 


13 


ctcgagcggt tct 




13 


<210> 


14 


<211> 


4 


<212> 


PRT 


<213> 


Artificial 


<400> 


14 


Ser Ser Gly Ser 


1 




<210> 


15 


<211> 


9 


<212> 


DNA 


<213> 


Artificial 


<400> 


15 


tctgcaggc 




9 


<210> 


16 


<211> 


3 
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poiycop . t>r-4r» • cxc 



<212> PRT 
<213> Artificial 

<400> 16 

Ser Ala Gly 
1 



<210> 17 

<211> 9 

<212> DNA 

<213> Artificial 



<400> 17 
aaagcttcc 
9 



<210> 18 

<211> 3 

<212> PRT 

<213> Artificial 

<400> 18 

Lys Ala Ser 
1 



<210> 19 

<211> 12 

<212> DNA 

<213> Artificial 

<400> 19 
atgaggggat cc 
12 



<210> 20 

<211> 17 

<212> DNA 

<213> Artificial 

<400> 20 
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artcaatgag gggatcc 
17 



<210> 
<211> 
<212> 



21 
18 
DISIA 



<400> 21 

caccatcacc atcaccat 
18 



<210> 22 

<211> 6 

<212> PRT 

<213> Artificial 

<400> 22 

His His His His His His 
1 5 



<210> 23 

<211> 45 

<212> DNA 

<213> Artificial 

<400> 23 

ctgcaccata tcctggaagc ccagaaaatg gaatggcacc cgcac 
45 



<210> 24 

<211> 15 

<212> PRT 

<213> Artificial 

<400> 24 

Leu His His lie Leu Glu Ala Gin Lys Met Glu Trp His Pro His 
15 10 15 
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<210> 25 

<211> 18 

<212> DNA 

<213> Artificial 

<400> 25 

aagaaaaaga aaaagaaa 
18 



<210> 26 

<211> 6 

<212> PRT 

<213> Artificial 

<400> 26 

Lys Lys Lys Lys Lys Lys 
1 5 
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